包括机器学习在内的计算分析方法对基因组学和医学领域具有重大影响。高通量基因表达分析方法,例如微阵列技术和RNA测序产生大量数据。传统上,统计方法用于基因表达数据的比较分析。但是,针对样品观察分类或发现特征基因的分类的更复杂的分析需要复杂的计算方法。在这篇综述中,我们编译了用于分析表达微阵列数据的各种统计和计算工具。即使在表达微阵列的背景下讨论了这些方法,也可以将它们应用于RNA测序和定量蛋白质组学数据集的分析。我们讨论缺失价值的类型以及其插补中通常采用的方法和方法。我们还讨论了数据归一化,特征选择和特征提取的方法。最后,详细描述了分类和类发现方法及其评估参数。我们认为,这项详细的审查将帮助用户根据预期结果选择适当的方法来预处理和分析其数据。
translated by 谷歌翻译
社交媒体使用量增加到今天的数字世界中的历史新高。大多数人口使用社交媒体工具(如Twitter,Facebook,YouTube等)与社区分享他们的思想和经验。分析共同公众的情绪和意见对政府和商界人士来说非常重要。这是在大选时间进行各种民意调查中的大量媒体机构激活的原因。在本文中,我们曾在2019年Lok Sabha选举期间分析了印度人民的情绪,使用该持续时间的推特数据。我们建立了一个自动推文分析仪,使用传输学习技术来处理这个问题的无监督性质。我们在我们的机器学习模型中使用了线性支持向量分类方法,此外,术语频率逆文档频率(TF-IDF)方法用于处理推文的文本数据。此外,我们提高了模型的能力,以解决一些用户发布的讽刺推文,其中一些用户尚未被该领域的研究人员考虑。
translated by 谷歌翻译
建筑信息建模(BIM)软件使用可伸缩的矢量格式,以便灵活地设计业内地板计划。建筑域中的地板计划可以来自可能或可能不是可扩展的矢量格式的许多来源。地板平面图的转换为完全注释的矢量图像是现在可以通过计算机视觉实现的过程。该领域的新型数据集已用于培训用于对象检测的卷积神经网络(CNN)架构。通过超分辨率(SR)的图像增强也是基于计算机视觉的基于CNN的网络,用于将低分辨率图像转换为高分辨率。这项工作侧重于创建一个多组件模块,该模块在楼层对象检测模型上堆叠SR模型。所提出的堆叠模型显示出比相应的香草对象检测模型更大的性能。对于最佳情况,纳入SR的含有在VANILLA网络上的物体检测中提高了39.47%。数据和代码在https://github.com/rbg-research/floor-plan-dection上公开提供。
translated by 谷歌翻译
域自适应语义分割的大多数现代方法依赖于适应期间继续访问源数据,这可能是由于计算或隐私约束而不可行的。我们专注于对语义分割的无源域适应,其中源模型必须仅为仅给出未标记的目标数据给出的新目标域。我们提出了增强一致性引导的自我培训(ATHCO),一种无源适应算法,它使用模型的像素级预测一致性,各种目标图像的自动生成的视图以及模型置信度来识别可靠的像素预测,并选择性地那些人的自动训练。ATHCO在三个标准基准测试中实现最先进的结果,以便在语义分割中的3个标准基准,所有内部都在实现和快速收敛方法中。
translated by 谷歌翻译
虽然许多对持续学习的作品显示了减轻灾难性遗忘的有希望的结果,但他们依赖于监督培训。要在标签无话量的增量设置中成功学习,模型必须区分学习和新颖的类,以适当地包括用于培训的样本。我们介绍了一种新颖的检测方法,可以通过培训来源作为新课程来利用网络混淆。我们发现在该检测方法期间结合了类别不平衡,大大提高了性能。我们的方法的有效性在一组图像分类基准中证明了:MNIST,SVHN,CIFAR-10,CIFAR-100和婴儿床。
translated by 谷歌翻译